A Pocket Shape Evaluation Technique Applying Protein Surface Technique “PROTEIN”
نویسندگان
چکیده
Protein is a main component of our body. It is important to determine the reactivity of proteins in the medicine development. It is well-known that drugs go in hollows (so called “pocket”) of protein surfaces to react. We attempt to evaluate reactivity of proteins with the drugs. As a preliminary step, this paper presents a pocket shape evaluation technique. Supposing that the protein surfaces are provided as triangular meshes, the technique first extracts the pockets from the protein surfaces and calculates feature values of pocket shapes. It then compares the feature value with feature value of sample-pockets which has high reactivity with the drugs. Keyword Protein,Pocket surface evaluation,Pocket extraction,Shape-Similarity Comparison 1. 概要 蛋白質は細胞の主要成分であり,細胞の働きを推し 進める,調節するなどといった人体において非常に重 要な役割を担っている.細胞内で働く蛋白質は何万種 類と存在し,それぞれが独自の構造体と機能を持って いる.また,薬の多くはその成分が蛋白質に作用する ことから,蛋白質は薬品開発においても注目されてお り,各蛋白質がそれぞれ薬とどの程度の親和性を持つ かを把握することが重要となっている.本報告では, 蛋白質と薬との親和性を druggability と呼ぶ.また, 薬が蛋白質に作用する際,薬成分は蛋白質表面上のあ る程度大きくて深い窪みに入り込み,その場所に一定 時間留まり相互作用することが多いとされている.こ のような蛋白質表面上の窪みを,本報告ではポケット と呼ぶ. 以上の背景から我々は,蛋白質表面形状分析プロジ ェクト PROTEIN の一環として,各蛋白質が薬とどの 程度の親和性を有するかを判定するための蛋白質の druggability 評価手法の確立を目指している.その前段 階として,本研究では蛋白質表面上の各ポケットの形 状評価値を算出する手法を提案する.本手法では,蛋 白質表面形状は三角メッシュで与えられていることを 前提として,以下の手順で評価値を算出する. 1. 評価値を算出したい蛋白質に対して,その表面形 状からポケットを抽出する. 2. 抽出した各ポケットに対して形状特徴量を算出 する. 3. 手順 2 で算出した特徴量に対し,あらかじめ算出 しておいた薬との親和性が高いサンプルポケッ トの形状特徴量と類似度比較し,評価値を算出す る. 2. 関連研究 2.1 蛋白質表面分析手法 PROTEIN 我々は,PROTEIN(Partial Relief Observation TEqnique and INterface)と称して,蛋白質表面形状分析に取り 組んでいる.その一環として我々は,蛋白質表面の局 所凹凸形状分類手法 [1]や,蛋白質表面形状からのポケ ット抽出手法 [2]を発表している.このうち [1]では,蛋 白質の反応性が部分形状に密接に関係していることに 着目し局所凹凸形状の分類およびその可視化を試みた. また [2]では,蛋白質表面上のポケット高速抽出を試み た.本報告では,蛋白質表面形状からのポケット抽出 に [2]の手法を適用する. 2.2 蛋白質の類似度評価値算出手法 文献 [3]は,様々な蛋白質の結合部位の類似度評価値 算出手法と,その結果公開のデータベースをサーベイ している.それらの中で,本手法と同じく蛋白質の表 面形状に着目した手法の一例として,eF-site[4]の三角 メッシュデータを用いて各頂点の物性付きベクトルに 対しクリーク探索法を適用する eF-seek[5]がある. 蛋白質ポケットの反応性評価にあたり,現時点で 我々は,蛋白質表面形状の幾何学的情報のみから評価 値を算出している.しかし,より信頼性の高い評価値 を算出するためには,幾何学的情報以外の情報も参照 する必要がある.そこで将来的には,提案手法に文献 [3]で紹介されているような手法を併用し,化学的情報 も加えた評価値算出手法の確立を視野に入れている. 2.3 三次元モデルの類似度比較 三次元モデルの類似度比較においても著名な手法が 数多く存在し,それらの手法は,特徴量として注目す る構造が幾何学的構造のものと,位相的構造のものに 分けることができる.幾何学的構造のものはさらに, 頂点に注目したもの,面に注目したもの,ボクセルに 注目したものに分けられる.代表的な手法として,モ デルの表面上に生成された点群に対して 2 点間の Euclid 距離のヒストグラムを用いた D2[6],D2 をさら に拡張した AAD[7],モデルの慣性主軸に沿った包絡 線を用いた PS[8],などがあげられる.我々はポケッ ト形状の特徴量算出に際して,ポケットの多くはお椀 や円錐のような形状をしており,その入り口から底に 向かった主軸に沿って特徴量を算出するのがよい,と 直感的に考えた.そこで提案手法では,D2 や PS を参 考にした特徴量算出方法を適用し,これらの手法と同 様に多次元ベクトルでポケット形状を表現している. 3. 提案手法 3.1 蛋白質表面形状 提案手法では,蛋白質表面形状は三角メッシュで近 似されていることを前提とする.我々による本手法の 実装は,eF-site[4]に登録されている分子表面形状を利 用している.eF-site では,PDB(Protein DataBank) に登 録されている蛋白質を対象として,コロニー曲面抽出 技術 [9]を適用して分子表面形状を算出し,データベー ス化して公開している.eF-site では,頂点,2 頂点を 両端とする稜線,3 稜線によって囲われた三角形領域, の集合で構成される三角メッシュを,XML 形式で記述 して提供している.また,このような幾何学的情報の 他に,各頂点には,疎水性,温度,電位といった化学 的情報も同時に与えられている. 3.2 ポケット抽出 本手法では,まず,評価値を算出したい蛋白質のポ ケットを蛋白質表面上から抽出する.ポケットを抽出 する手段として [2]の手法を用いる.この手法は,以下 のステップで構成されている. 1. 蛋白質表面を構成する三角メッシュに対してメ ッシュ単純化を適用し,微小な凹凸を平滑化した 概略的な表面形状を得る. 2. 単純化された三角メッシュ上の各頂点に対して, 接平面を算出し,隣接頂点がすべて接平面の内側 なら当該頂点に凹部の属性を与える. 3. 凹部頂点群を構成する三角形群を抽出する. 4. 抽出された凹部三角形群を単純化前の三角メッ シュに投影する. これらの処理により単純化前の三角メッシュ上に得ら れた凹部がポケットとなる.抽出されたポケットを青 く塗った蛋白質表面の例を,図 1 に示す. 3.3 ポケットの形状特徴量算出 続いて,前節の処理によって抽出されたポケットの 形状特徴量を算出する.本手法の特徴量は,薬成分の 入り込み易さに影響を及ぼすとされるポケットの深さ と口の広さにもとづいた多次元ベクトルである.以下 にその処理手順を示す.また,図 2 はポケット形状の 一例を簡略化し,上と横の双方から見た図を用いて処 理手順を示したものである. 1. ポケットの外周面を近似する平面とその平面の 中心を算出する. 2. 平面を中心からの距離で m 区間に,また,平面の 中心からの法線ベクトルを平面からの深さで n 区 間に,それぞれ等間隔に分割する. 3. ポケットを構成する三角メッシュ上にできるだ け等密度に点群を生成する. 4. 各点に対して,その点が中心からの距離と平面か らの距離がそれぞれどの区間に属しているかを 求める. 5. 平面上の各区間に対し,各々の深さの区間に含ま れている点の個数についてのヒストグラムを生 成し,各階級の度数を特徴量の各次元の値とする. 図 2 ポケットの特徴量算出手法 なお,手順 2 において,各区間の間隔は経験的に 1Å とした.また,手順 4 において,中心からの距離が m 区間目を超えてしまった点はすべて m 区間目に属する とする.深さについても同様の処理をする.以上の処 理手順より m×n 次元の形状特徴量が得られる. 3.4 ポケットの評価値算出 続いて本手法では,薬との反応性が高いと推測され たサンプルポケット群を用意し,これらについて形状 特徴量を算出する.そして,与えられたポケットの特 徴量との類似度比較により,当該ポケットの評価値を 算出する. 3.4.1 サンプルポケット群の生成 現時点での我々の実装では,PDB に登録されている 蛋白質から,薬との親和性が高いと推測されるポケッ ト群を収集する.PDB に登録されている蛋白質の中に は,主に結晶化の過程で残留した,蛋白質の構成分子 以外の分子 (HETATM)の情報が記載されているものが 多い.HETATM の多くは蛋白質と相互作用し易い部位 に位置していることが知られている.このことから 我々は,HETATM の集中部位周辺のポケットを,薬と の親和性が高いポケットと仮定し,サンプルポケット とする. 我々の実装では,HETATM が与えられた多数の蛋白 質からサンプルポケットを抽出し,これらの形状特徴 量を前節と同じ処理で求め,それをサンプルポケット 群の特徴量 B1,B2,...,Bk とする.抽出されたサンプルポ ケットを蛋白質表面上に表示した例を図 3 に示す.赤, 緑,緑の微小な球が HETATM を示し,紫で塗られたポ ケットがサンプルポケットである.なお HETATM の色 は赤が酸素,緑は炭素,シアンは窒素を示す. 3.4.2 形状特徴量の類似度比較 続いて,評価値を算出したいポケットと各サンプル ポケットを類似度比較する.評価値を算出したいポケ ットの特徴量 A と,サンプルポケット群の特徴量 図 1 ポケット抽出の例 図 3 サンプルポケットの例 深さの区間 点 の 個 数 B1,B2,...,Bkの各々に対して,式 (1)を適用して類似度 S1,S2,...,Sk を求める. そして S1,S2,...,Sk の中で最大値のもの,つまり A に最 も類似する B との類似度の値を,A の評価値 E とする. 4. 実行結果 前節までの処理で算出した各ポケットの評価値を 色付けで蛋白質表面形状に表示した実行結果を図 4 に 示す.色は,青から赤に向けて評価値が高くなる. 5. まとめ 本報告では,蛋白質表面上の各ポケットの形状評価 値を算出する手法を提案した.この形状評価値算出手 法は,蛋白質の druggability 評価手法を開発するため の前段階と位置づけられる.また,本研究は製薬関係 の専門家と一緒に進めているものであり,現時点では 以下の点を製薬の現場で実用化するための課題として いる. 多数の蛋白質に対して,本手法を適用し検証する ポケットの形状評価を回帰分析問題として扱い, サンプルポケットの特徴量の学習を評価値の算 出に適用する. 形状的欠点(=薬との親和性の低さ)を表すルー ルを定義し,そのルールとの適合度判定を評価値 算出の処理過程に組み込む. 蛋白質表面の幾何学的情報の他に,化学的情報も 用いて評価値を算出する. また,蛋白質表面上の各ポケットの評価値にもとづい て,本研究の最終目的である蛋白質本体の評価値算出 手法の確立にも着手したい. 参 考 文 献 [1] K. Nishiyama, T. Itoh, PROTEIN: A Visual Interface for Classification of Partial Reliefs of Protein Molecular Surfaces, The Institute of Image Electronics Engineering of Japan, Vol. 37, No. 3, pp. 181-188, 2008. [2] 中村 , 伊藤 , 蛋白質表面形状分析手法 PROTEIN を 用いたポケット分析 , 第 2 回データ工学と情報マネジ メントに関するフォーラム (DEIM 2010). [3] Stephanie Perot, Olivier Sperandio, Maria A. Miteva, Anne-Claude Camproux, Bruno O. Villoutreix, Druggable pockets and binding site centric chemical space: a paradigm shift in drug discovery, Drug Discovery Today Vol. 15, Issues 15-16, pp. 656-667, 2010. [4] eF-site, http://ef-site.hgc.jp/eF-site/index.jsp [5] K. Kinoshita, et al., Identification of protein functions from a molecularsurface database, eF-site. J. Struct. Funct. Genom. Vol. 2, pp. 9-22, 2002. [6] R. Osada, T. Funkhouser, B. Chazelle, D. Dlbkin, Matching 3D Models with Shape Distributions, Proc. Int’l Conf. on Shape Modeling and Application 2001, pp. 154-166, 2001. [7] R. Ohbuchi, T. Minamitani, T. Takei, Shape Similarity Search of 3D Models by using Enhanced Shape Functions, Proc. Theory and Practice in Computer Graphics, 2003. [8] 小田切智, 衣鳩昌俊, 武井毅, 大渕竜太郎, 慣性 モーメントの包絡線を用いた3 次元モデルの形状類似 検索 , 映像情報メディア学会誌 , Vol. 56, No. 10, pp. 48-56, 2002. [9] Molecular Surface Package, http://connolly.best.vwh.net/ 図 4 ポケットの評価値算出結果の例 E low high
منابع مشابه
Protein and Lactose Separation by Modified Ultrafiltration Membrane using Layer by Layer Technique
Layer-by-Layer (LbL) is a method which can be used for nanoscale coating and surface functionalization of a material. LbL technique mainly uses the electrostatic attracting between charged materials (polyelectrolytes, nanoparticles, etc.) and an oppositely charged surface. In this study, protein separation (BSA) from lactose solution was carried out using the LbL self-assembly method, which was...
متن کاملPocketPicker: analysis of ligand binding-sites with shape descriptors
BACKGROUND Identification and evaluation of surface binding-pockets and occluded cavities are initial steps in protein structure-based drug design. Characterizing the active site's shape as well as the distribution of surrounding residues plays an important role for a variety of applications such as automated ligand docking or in situ modeling. Comparing the shape similarity of binding site geo...
متن کاملExpression and Purification of Recombinant Outer Surface Protein D of Borrelia burgdorferi
To carry out the immunological experiments on the serum of Multiple Sclerosis (MS) patients, based on a correlation between Borrelia burgdorferi infection and contracting MS autoimmune disease the outer surface protein D (OspD) of the bacterium was expressed and purified. A clone containing the OspD gene in pET11a expression vector under the control of T7 promoter was transformed to the bacteri...
متن کاملApplication of Near Surface Mounted (NSM) technique for Seismic Retrofitting of Heritage Buildings
The high vulnerability of the cultural buildings due to seismic actions urged researchers to retrofit them using reversible and compatible techniques. The application of fiber reinforced polymer (FRP) for enhancing the structural behavior of masonry buildings, under seismic actions, has been studied by many researchers. The near-surface mounting (NSM) technique is a relatively new retrofitting ...
متن کاملApplication of radioimmunoassay technique for determination of antigen concentration in different cells with a new monoclonal antibody [Persian]
Introduction: Binding a monoclonal antibody to tumor associated antigens is an effective method for cancer therapy because these agents can specifically target malignant cells, in fact monoclonal antibodies are effective agents for diagnosis, grading and treatment of different kinds of cancers. Methods: In this research, a new monoclonal antibody against colon cancer cells was prepared an...
متن کاملComparative Evaluation of Surface Roughness of Three Different Composite Resins Following Polishing with a Two-Step Technique
Background and Aim: Nowadays, demand for same–color restorative materials, especially resin composites, is increasing. Access to the smooth surface with minimum level of surface roughness significantly results in more beauty, and the reduction of the accumulation of the plaque, gingival inflammation, and tooth discoloration. the aim of this study was surface roughness of three different composi...
متن کامل